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摘 要 : [目的 /意义 ] 通 过 馆藏 图 书 分 类 和 流通 数据 ,发 现 读者 特征 与 馆藏 流通 之 间 的 关联 ,建立 关系 模型 ,通过 模型 拟 合 
与 预测 ,探索 读者 与 图 书 流通 之 间 的 隐 含 规律 ,为 图 书馆 智慧 管理 提供 技术 与 手段 的 支持 。|[ 方 法 /过 程 ] 采 用 聚 
类 和 相关 分 析 技 术 , 提 取 读 者 宏观 可 观测 特征 ,建立 读者 特征 与 图 书 分 类 之 间 直 接 和 间接 的 映射 关系 ,进而 建立 
读者 特征 与 分 类 图 书 流通 量 的 回归 模型 ,并 验证 模型 有 效 性 和 优化 模型 拟 合 优 度 。 根 据 有 效 模型 ,探索 图 书馆 流 
通 趋 势 , 并 挖 气 读 者 宏观 特征 层面 下 所 隐 含 的 知识 建构 本 质 与 规律 ,以 及 对 图 书 流通 产生 的 影响 程度 。| 结果 / 结 


馆 开展 知识 服务 提供 可 靠 的 技术 支持 。 
词 : 高 校 图 书馆 ”流通 预测 数据 挖 气 线性 回归 
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论 ] 具 有 代表 读者 社会 角色 要 求 的 专业 学 习 方向 代表 读者 间 群 体 互动 效应 的 入 学 批 次 读者 群体 数量 3 个 有 关 
读者 的 分 类 特征 ,能 够 有 效 拟 合 和 预测 图 书 流通 量 。 预 测 结果 表明 ,模型 准确 率 较 高 ,能 够 作为 有 效 工具 ,为 图 书 
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1QN 言 
ll 言 

CN 图 书 流通 量 是 读者 与 馆藏 互动 的 结果 ,是 联结 读 
者 号 馆藏 的 关键 指标 ,是 衡量 图 书馆 馆藏 建设 和 读者 


为 趋势 具有 很 大 的 不 确定 性 ,采用 社会 学 研究 的 数理 
统计 方法 ,对 读者 图 书 借阅 行为 与 馆藏 流通 之 间 关 联 
关系 进行 研究 ,揭示 隐藏 在 随机 借阅 事件 中 的 规律 和 
变化 趋势 ,并 进行 描述 和 预测 ,对 图 书馆 把 握 读者 知识 


肪 疾 质 量 的 核心 要 素 。 建 立 基 于 不 同类 别 图 书 流通 量 
的 贸 述 模型 ,预测 馆藏 流通 趋势 ,不 仅 能 够 提高 图 书馆 
的 破 务 质量 ,预见 性 指导 图 书馆 开展 相关 工作 ,还 能 为 
进步 揭示 馆藏 流通 内 在 运行 规律 提供 有 力 的 支撑 。 
高 校 图 书馆 读者 与 馆藏 互动 频繁 ,虽然 图 书 和 读者 周 
期 性 更 新 频率 较 快 ,但 围绕 学 科 和 教学 服务 的 高 校 图 
书馆 馆藏 建设 ,无 论 馆藏 数量 怎样 增长 ,馆藏 各 类 目 占 
比 都 较为 稳定 ;高 校 读者 群体 更 新 较 快 ,虽然 每 年 都 存 
在 新 生 入 学 和 毕业 生 离 校 的 交替 ,但 读者 总 体 数量 与 
身份 特征 相对 稳定 。 因 此 ,基于 稳定 数量 与 分 类 特征 
的 读者 群体 ,以 及 稳定 基数 和 占 比 的 馆藏 之 间 ,形成 大 
量 图 书 流通 数据 ,为 探索 读者 需求 和 馆藏 流通 之 间 的 
纲 律 ,提供 了 坚实 的 数据 支撑 。 
1.1 相关 依据 

读者 作为 各 自 独 立 且 存 在 差异 的 社会 个 体 ,其 行 


晤 | 


需求 趋势 ,有 针对 性 地 进行 图 书 采访 和 开展 知识 服务 
具有 重大 的 现实 意义 。 相 关 研 究 表明 ,读者 借阅 动机 
和 使 用 图 书馆 的 便利 性 是 促成 读者 发 生 相关 类 别 图 书 
借阅 行为 的 直接 因素 ;社会 分 工 对 读者 社会 角色 的 要 
求 , 促 使 读者 形成 知识 需求 的 动机 ;读者 对 其 社会 角色 
的 自我 期 待 方向 及 动机 强度 ,推动 读者 产生 知识 交流 
和 自我 知识 建构 的 图 书 阅读 行为 ;读者 借阅 行为 是 由 
读者 所 担当 的 社会 角色 以 及 角色 期 待 ,在 整体 社会 文 
化 背景 下 ,结合 自身 与 其 他 读者 之 间 的 差异 化 特征 ,在 
特定 的 社会 知识 环境 中 ,在 信息 与 知识 交流 等 因素 共 
同 作 用 下 ,阅读 动机 强度 短期 迅速 增强 后 ,发 生 的 知识 
获取 行为 与 结 

由 读者 社会 角色 和 背景 构成 的 读者 身份 特征 ,本 
质 上 是 在 社会 文化 和 知识 背景 下 对 读者 的 分 类 ,是 读 
者 借阅 相关 类 别 图 书 的 基础 。 大 量 研究 成 果 表 明 , 读 
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者 当前 所 处 的 年 龄 段 , 社 会 角色 以 及 读者 对 未 来 社会 
角色 和 地 位 的 期 待 是 隐藏 在 读者 阅读 动机 背后 最 根 
本 最 直接 的 影响 因素 。 不 同类 型 的 读者 对 某 些 特定 
类 型 的 图 书 具 有 明显 的 需求 偏好 ,如 女性 读者 偏爱 女 
性 主角 的 小 说 所 ,年 轻 女 性 侧重 爱情 文学 图 书 , 已 婚 
女性 偏爱 散文 .游记 图 书 ” ;农民 工 的 阅读 倾向 主要 
是 休闲 性 文学 书籍 和 实用 性 较 强 的 技能 与 考试 类 书 
籍 21 。 同 样 ,不 同类 别 的 图 书 ,尤其 是 专业 性 较 强 的 
图 书 , 大 多 指向 专业 性 特征 明显 的 固定 类 型 读者 ,如 
古籍 文献 的 主要 读者 群体 ,大 多 是 开展 科研 工作 的 
研究 人 员 中 。 

高 校 大 学 生 读 者 除了 专业 方向 不 同 以 外 ,在 微观 
上 还 存在 地 域 .家 庭 教育 和 个 性 发 展 方向 等 差异 特征 ; 
而 年 龄 .教育 成 长 等 社会 宏观 背景 ,以 及 对 社会 、 人 


生生 感 和 家 庭 ,职业 期 待 的 知识 需求 和 储备 动机 等 因 
素 别 | 具有 较 强 的 同 质 化 特征 。 大 学 生 是 具有 独特 社 

色 特 征 的 读者 群体 ,在 图 书 需求 方面 ,除了 所 学 专 
业 得 关 图 书 以 外 ,偏爱 小 说 自然 与 人 文 社会 科学 类 的 


@ 由 此 可 见 , 读 者 身份 特征 尤其 是 读者 差异 化 特征 
形成 的 知识 需求 偏好 ,能 够 反映 读者 图 书 阅读 需求 特 
ED 因此 ,基于 相似 特征 读者 的 借阅 数据 ,使 得 描述 和 
测 E 和 趋势 成 为 可 能 。 


Ps 采用 数理 分 析 方 法 ,分 析 高 校本 科 生 读者 的 图 书 
借阅 偏好 ,需要 合理 有 效 地 提取 与 选择 读者 的 特征 , 根 


据 读者 特征 设计 假设 性 分 析 模 型 ,探索 不 同 特征 读者 
与 而 同 分 类 图 书 之 间 的 流通 关系 。 

建立 合理 的 推断 前 提 , 是 开展 量化 研究 的 基础 。 
高 校 图 书 流通 一 般 具 有 以 下 特征 : 与 读者 的 专业 方向 
有 关 , 专 业 方向 的 学 习 内 容 通过 课程 具体 表现 ; 与 读 
者 的 数量 有 关 , 包 括 读者 总 量 和 各 个 专业 的 读者 数量 ; 
与 读者 之 间 互动 有 关 , 主 要 指 联系 频繁 的 读者 之 间 , 进 
行 交流 互动 促成 的 知识 需求 ;与 读者 其 他 需求 有 关 , 如 
确立 考研 深造 目标 产生 的 知识 需求 ,疾病 产生 的 知识 
需求 ,以 及 青年 人 对 情感 婚姻 .职业 期 待 方面 产生 的 
知识 需求 等 。 其 中 ,不 同类 别 图 书 流通 量 出 现 差别 的 
关键 因素 ,最 有 可 能 是 由 读者 的 专业 方向 以 及 读者 数 
量 的 影响 导致 的 。 由 于 专业 分 类 与 图 书 分 类 ,是 两 个 
不 同 领 域 的 分 类 ,相同 名 称 的 分 类 名 词 ,在 概念 内 涵 
上 , 既 具 有 一 定 知识 关联 ,又 分 别 在 各 自 领 域 代表 不 同 
的 意义 。 因 此 ,还 需要 通过 专业 课程 的 重要 载体 ,如 对 


对 应 关系 。 读 者 之 间 的 交流 互动 ,对 图 书 流通 产生 的 
影响 较为 复杂 。 一 方面 相同 专业 、 相 同人 学 批 次 的 读 
者 , 因 学 习 共同 课程 ,互相 交流 频繁 ,共同 借阅 相关 主 
题 类 图 书 ,有 一 些 直 接 规 律 可 循 ; 另 一 方面 ,与 专业 方 
向 无 关 的 图 书 借阅 , 则 可 能 缘 于 读者 之 间 的 日 常 或 随 
机 交流 内 容 , 此 种 情况 造成 的 图 书 流通 特点 和 规律 ,也 
需要 深入 研究 。 因 此 ,本 研究 假设 读者 特征 因素 是 影 
响 图 书 流通 的 关键 因素 ,将 读者 特征 因素 作为 重点 考 
察 的 变量 指标 ,分 析 其 对 分 类 图 书 流通 量 产 生 影 响 的 
程度 ,由 此 ,本 研究 将 图 书 流 通 量 与 读者 特征 之 间 的 关 
系 描述 为 : 

读者 特征 组 合 X= (x ,x,,… ,x, ) 与 图 书馆 的 知识 
分 类 C 具有 某 种 关联 和 映射 关系 ,根据 该 类 特征 的 读 
者 与 知识 互动 的 流通 历史 记录 作为 统计 数据 ,进行 相 
关 分 析 和 聚 类 分 析 ,筛选 出 特征 明显 的 读者 特征 ,建立 
回归 模型 ,找到 各 种 因素 对 图 书 流通 量 的 影响 程度 ,以 
及 模型 对 图 书 流通 量 预 测 的 拟 合 优 度 ,从 而 以 严格 的 
数学 方法 阐释 读者 特征 对 图 书 需求 的 因果 关系 ,进而 
探索 和 揭示 隐藏 在 读者 知识 需求 背后 的 图 书 阅读 与 流 
通 的 规律 。 

定义 工 :在 给 定 的 读者 集合 R 以 及 读者 特征 xi = 
(xij ,Xi ,Xi) 中 ,建立 X 与 馆藏 流通 y= (yi,y,,，…， 
y;) 之 间 的 函数 关系 ,i 表示 读者 或 读者 分 类 ,j 表示 图 
书 或 图 书 分 类 : 

y=f(x1 ,yy) 公式 (1) 

本 研究 的 目的 在 于 建立 合适 的 模型 ,找到 合适 的 
读者 特征 X, 利 用 X 解释 馆藏 流通 Y, 并 能 够 合理 阅 释 
X 对立 的 因果 量化 关系 ,以 及 根据 X 预测 Y。 
1.3 ”相关 研究 

以 往 探究 读者 借阅 与 流通 内 在 机 制 与 趋势 的 研 
究 , 主 要 有 以 下 3 种 模式 。 
1.3.1 数据 对 比 模式 
基于 调查 和 统计 数据 ,通过 量化 指标 比 对 ,得 出 读 
者 阅读 的 倾向 与 偏好 。 胡 一 机 “以 公共 图 书馆 为 例 ， 
通过 对 图 书 流通 统计 数据 的 调查 ,分 析 读 者 阅读 倾向 
及 其 影响 因素 ,论证 了 读者 阅读 倾向 分 析 的 必要 性 。 
囊 红 志 “ 分析 借阅 的 历史 数据 ,通过 藏书 流通 和 图 书 
利用 率 , 了 解读 者 的 借阅 习惯 及 读者 需求 的 变化 ; 谢 丹 
玫 等 中 利用 加 权 流 通 率 的 计算 方法 进行 学 生 阅 读 兴趣 
的 主 分 量 分 析 , 在 对 图 书 流通 清单 数据 的 挖掘 和 分 析 
基础 上 ,了 解 学 生 阅 读 需 求 , 并 改进 馆藏 结构 ; 周 国 正 
和 张 学 敏 ”通过 网 络 问卷 调查 法 ,采集 在 校 学 生 阅 读 


Wn 


教材 的 图 书 分 类 ,将 专业 方向 和 图 书 分 类 之 间 建 立 起 


目的 \ 阅 读 内 容 \、 阅 读 方式 以 及 阅读 层次 等 方面 的 信 
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息 ,并 对 所 获 数 据 进行 分 析 ,总 结 高 校 学 生 阅读 目的 主 
要 为 学 习 与 消遣, 阅读 内 容 专业 特征 明显 ,呈现 浅 阅 
读 .、 网 络 化 阅读 等 特征 ; 吴 晓 海 和 黄 芳 "通过 对 首都 
医科 大 学 图 书馆 图 书 流通 数据 进行 统计 分 析 发 现 ,图 
书 流通 量 与 所 学 专业 和 未 来 工作 生活 密切 相关 ,与 陶 
冶 性 情 . 树 立 人 生 观 、 人 际 交往 等 方面 息息相关 。 
1.3.2 ”相关 性 分 析 模 式 

利用 统计 数据 ,假设 读者 的 一 些 特征 与 图 书 流通 
有 关 , 利 用 统计 学 算法 进行 相关 性 分 析 , 得 到 不 同 因素 
与 读者 借阅 存在 正 向 或 负 向 相关 关系 。 韩 丽 " 通过 
量 表 问卷 和 二 阶 方程 模型 ,提取 并 验证 了 读者 的 自主 
动机 、 基 本 心理 需要 满足 对 读者 课外 阅读 意愿 3 个 变 
量 对 读者 课外 阅读 意愿 产生 正 向 影响 ,而 受 控 动机 对 
课外 阅读 意愿 则 不 产生 影响 ; 赵 雨 稚 ”利用 关联 规则 
中 的 Apriori 算法 分 析 读者 需求 特征 和 阅读 趋向 ,为 划 
分 渍 者 群 细 分 因素 提供 合理 依据 ,结合 读者 自身 属性 
条 腔 同 读者 的 需求 特征 选取 读者 细 分 因素 ,采取 聚 类 
算 肖 细 分 读者 群 ,建立 聚 类 模型 ,从 而 清晰 地 揭示 了 读 
: 群 需 求 的 差异 性 ; 耿 倩 "在 对 读者 的 累计 借阅 数量 

简单 贝 叶 斯 分 类 算法 挖掘 的 过 程 中 ,发 现 图 书馆 
下 铅 通 过 建立 读者 个 人 档案 来 了 解读 者 背景 ,挖掘 读 
者 区 
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8 国 借阅 兴趣 ,进而 改进 阅读 行为 ,提供 更 加 主动 的 扒 
项 服务 ; 陈 添 源 "“ 利用“ 网络 图 ”节点 和 Apriori 模型 
进 得 图 书 分 类 号 的 链接 分 析 和 读者 借阅 图 书 的 分 类 关 
联 嚼 切 程度 ,并 采用 关联 规则 向 读者 推荐 图 书 。 

333 建 模 分 析 模 式 

过 统计 数据 ,建立 各 种 分 析 模 型 ,探究 读者 的 行 
劣 旺 征 的 影响 程度 ,并 预测 未 来 的 借阅 需求 趋势 。 牛 
秀 551 利用 多 指数 平滑 法 对 华北 科技 学 院 图 书馆 2007 
年 1 月 至 2009 年 12 月 的 月 度 图 书 借阅 数据 进行 了 实 
证 分 析 和 预测 ; 陈 娟 和 洪 丹 "9 利用 Logistic 回归 模型 
对 用 户 的 借阅 影响 因素 进行 分 析 , 结 果 发 现 ,用 户 的 借 
阅 数量 受 电 子 资源 .用 户 课外 阅读 时 间 .图 书馆 环境 、 
用 户 对 课外 阅读 的 认识 以 及 身边 好 友 的 影响 ,而 用 户 
的 学 历 . 性 别 、 学 院 特征 及 主要 的 借阅 动机 对 用 户 的 借 
阅 数量 则 没有 显著 性 影响 ; 尹 志 强 哺 针对 当前 高 校 图 
书馆 图 书 借阅 流量 预测 模型 存在 的 精度 低 难题 ,引入 
混沌 理论 对 高 校 图 书馆 图 书 借阅 流量 原始 数据 进行 分 
析 , 建 立 高 校 图 书馆 图 书 借阅 流量 建 模 的 学 习 样本 , 实 
验 结果 表明 模型 预测 图 书 借阅 流量 性 能 更 优 ; 张 加 和 
张 永 梅 5 利用 灰色 神经 网 络 算法 收敛 速度 较 快 . 误 差 
值 小 特点 ,预测 图 书 月 借阅 量 ; 葛 凡 "J 采用 灰色 系统 
模型 和 后 验 差 检 验 准 则 ,预测 TP 类 和 TQ 类 两 个 类 目 


图 书 在 未 来 5 年 的 借阅 量 ; 田 梅 ”采用 支持 向 量 机 作 
为 建 模 工具 ,利用 混沌 时 间 序 列 理论 对 图 书 借阅 流量 
行为 进行 了 建 模 和 学 习 预 测 ; 钟 亮 ”将 用 户 兴趣 爱 
好 ,书籍 受 欢 迎 程度 和 用 户 对 书籍 的 评价 等 参数 组 成 
差异 性 矩阵 ,确定 各 参数 影响 权重 、 建 模 计算 用 户 对 书 
籍 的 评分 ,融合 采用 下 - 最 近邻 分 类 法 和 朴素 贝 叶 其 
分 类 法 来 分 类 过 滤 数 据 ,设计 实现 一 种 数字 图 书 用 户 
喜好 预测 算法 。 


2 ”研究 方法 与 数据 集 


2.1 研究 方法 

馆藏 流通 的 核心 问题 是 解决 某 类 或 某 种 馆藏 流通 
量 与 读者 特征 之 间 的 关系 问题 。 很 多 机 器 学 习 的 方法 
都 可 以 完成 描述 和 预测 任务 ,考虑 到 需要 通过 研究 与 
苛刻 的 论证 ,解释 读者 特征 对 馆藏 流通 的 影响 关系 ,本 
研究 采用 机 器 学 习 中 最 为 成 熟 和 严谨 的 多 元 线性 回归 
方法 ,多 元 线性 回归 模型 是 经 济 学 和 其 他 社会 科学 中 
最 广泛 使 用 的 实证 分 析 工 具 王 ,通过 假设 某 些 自 变量 
对 因 变 量具 有 某 种 因果 作用 ,建立 拟 合 模型 ,对 模型 假 
设 性 条 件 进行 全 面 检验 ,对 具有 明显 随机 性 社会 事件 
的 馆藏 流通 量 进行 科学 解释 。 

馆藏 流通 与 读者 身份 特征 之 间 的 关系 可 以 描述 为 
多 元 线性 回归 问题 :有 m 个 读者 或 读者 类 型 样本 ,每 
个 样本 对 应 于 mn 维特 征 和 一 个 流通 结果 输出 y,: 


(0) (0) (0) (1) (1) (WY 
(x MX2 ,Nn ,yo ) ，(21 MX2 Nn J 


ye 
对 于 n 维 读者 特征 的 样本 数据 ,基于 公式 (1), 构 
建 分 类 馆藏 流通 的 线性 回归 拟 合 模型 
yj ) =0, +O% + ,+OX， 公式 (2) 
公式 (2) 中 0,(i = 0,1,2,…,n) 为 模型 参数 ,x,(i 
= 0,1,2,…,n) 为 每 个 样本 的 n 个 特征 值 。9 值 就 是 
每 个 特征 对 图 书 流通 量 的 贡献 率 ,9 的 结果 采用 最 小 
二 乘法 计算 : 


(m) (m) 
(NK ,x 


0=(XIX) "XY 公式 (3) 

最 小 二 乘法 有 着 严格 清晰 的 数学 推导 过 程 , 并 可 

对 推导 过 程 进 行 解 释 。 最 终 得 到 包含 误差 项 的 样本 回 
归 方 程 : 


公式 (4) 

由 于 可 观测 数据 仅仅 是 整体 读者 的 抽样 样本 ,最 
小 二 乘法 是 建立 在 高 斯 分 布 基础 上 ,为 确保 模型 的 可 
徘 性 ,还 需要 对 模型 的 残 差 进行 正 态 性 \ 残 差 齐 性 、 残 
差 独立 性 检验 ,以 及 对 模型 和 特征 参数 进行 可 靠 性 


检验 。 


y= Qa +0%;+eé) 
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2.2 ”数据 集 
数据 集 来 自 太原 科技 大 学 图 书 管理 系统 数据 库 中 
2002 年 至 2018 年 6 月 的 流通 数据 表 .读者 信息 表 、 包 
藏 MARC 数据 以 及 2011 年 以 来 各 个 专业 的 招生 统计 
数据 。 数 据 整合 处 理 后 ,仅仅 保留 本 科 生 数据 ,生成 一 
个 包括 读者 信息 、 馆 藏 信息 和 流通 信息 等 内 容 的 流通 
记录 表 , 其 所 包含 的 字段 有 读者 卡号 .读者 专业 读者 
入 学 时 间 、 图 书 题名 图书 作 者、 图 书 分 类 号 、 借 出 时 
间 、 借 出 发 生 读者 的 年 级 。 另 生成 一 个 招生 信息 表 , 包 
含 以 下 字段 :招生 时 间 专业 和 名称. 人数 。 本 研究 建立 
的 图 书 分 类 表 采 用 《中 国 图 书馆 分 类 法 》 的 分 类 标准 ， 
由 英文 字母 j 标记 不 同 的 图 书 分 类 (其 中 j =1,2,…， 
j) ,流通 数据 中 的 图 书 分 类 ,根据 流通 图 书 的 条 码 ,对 应 
该 图 书 的 馆藏 MARC 数据 中 的 图 书 分 类 号 ,代表 一 类 图 
书 或 一 种 图 书 。 人 研究 工具 采用 R 语言 (Version 3.4.1)， 
以 珊 支 持 线性 回归 分 析 的 工具 包 。 
数据 清洗 主要 内 容 是 在 生成 新 的 流通 记录 表 时 ， 
联 数 据 不 完整 或 缺失 关键 字段 内 容 的 记录 ,包括 通 


Ea 


壕 漂 者 卡号 映射 读者 信息 表 , 因 错误 不 能 获取 和 建立 
知 各 的 读者 信息 记录 ,也 包括 因为 馆藏 数据 错误 ,而 不 
能 钛 到 和 建立 完整 借阅 馆藏 信息 的 记录 。 最 终 可 用 的 
人 于 读者 流通 记录 772 206 条 ;2011 年 以 来 的 读者 流 
通 沪 录 166 763 条 ,2011 - 2015 年 完成 4 年 学 业 的 本 
科 征 读者 流通 记录 147 860 条 ,2015 年 以 后 人 学 的 当 
放 校本 科 生 流通 记录 18 903 条 。 鉴 于 图 书馆 对 读 
者 数据 收集 的 限制 ,以 及 高 校对 学 生 数 据 管理 的 具体 
情况 ,图 书馆 能 够 获取 的 读者 可 观测 信息 极其 有 限 ,如 
该 模 的 读者 完整 数据 存储 于 学 校 一 卡通 系统 的 数据 库 
中 ,图 书馆 的 读者 数据 仅 是 当 读者 发 生 借阅 活动 时 ,由 
图 书 管理 系统 向 一 卡通 系统 调 取 读 者 部 分 信息 数据 
后 , 才 会 将 得 到 的 数据 存储 到 图 书 管理 系统 中 。 图 书 


受 大 学 本 科教 育 ,具有 相同 或 接近 的 教育 内 容 和 知识 
积累 。 在 入 学 之 后 读者 最 大 的 差异 化 特征 就 是 专业 方 
向 ,专业 方向 决定 读者 4 年 的 学 习 内 容 , 也 是 学 生 未 来 
人 生 与 职业 生涯 中 极其 重要 的 身份 特征 。 

鉴于 数据 收集 情况 ,按照 可 观测 特征 ,将 读者 集合 
CR) 数据 集 的 读者 特征 数据 分 为 3 类 :读者 专业 方向 
(i ) \ 读 者 专业 人 数 (i,) 、 读 者 入 学 批 次 (is)。 专 业 方 
向 作为 高 校 学 生 最 基本 特征 ,将 读者 的 类 型 依据 知识 
学 习 内 容 进行 初步 划分 ,进一步 深入 到 课程 教材 的 图 
书 分 类 层面 ,考察 专业 分 类 对 专业 图 书 借阅 量 影 响 程 
度 ; 专 业 人 数 作为 读者 特征 ,可 在 分 类 读者 数量 规模 方 
面 ,进一步 考察 读者 专业 方向 的 差异 性 对 专业 有 关 图 
书 借阅 量 的 影响 程度 ;专业 入 学 批 次 作为 读者 特征 , 主 
要 考察 同一 入学 批 次 的 读者 相互 之 间 的 影响 与 交流 密 
切 程 度 , 对 图 书 借阅 量 的 影响 程度 。 

高 校 读者 进行 分 类 的 特征 还 有 很 多 ,对 一 些 无 法 
观测 的 分 类 特征 ,如 性 别 特征 、 入 学 前 居住 地 特征 等 ， 
对 图 书 借阅 量 造 成 的 影响 往往 会 体现 在 模型 的 残 差 
中 , 当 残 差 对 模型 的 精度 造成 的 影响 超过 模型 置信 区 
间 要 求 , 则 说 明 研 究 选择 的 读者 特征 无 法 解释 图 书 流 
通 量 。 

3.2 读者 专业 方向 分 类 特征 与 分 类 图 书 流 通 量 关系 
分 析 

以 读者 专业 方向 作为 关键 分 类 特征 ,探索 读者 对 
不 同 种 类 图 书 的 偏好 ,是 否 存在 确定 的 关联 关系 ,是 开 
展 研 究 的 假设 性 关键 前 提 和 基点 。 利 用 大 数据 可 视 化 
分 析 方 法 ,能 够 简单 直观 展示 出 隐藏 在 数据 背后 的 特 
征 ,随机 选择 2014 年 和 人 学 在 校 4 年 的 读者 借阅 数据 ， 
生成 流通 数据 的 可 视 化 视图 一 一 桑 基 图 ( 见 图 1) ,图 1 
中 上 层 标签 代表 各 个 专业 借阅 总 量 , 底 层 标签 是 22 类 
图 书 流 通 总 量 , 上 层 和 下 层 的 数量 相等 ,中 间 的 连 线 反 


管理 系统 中 仅 记录 发 生 借阅 行为 的 读者 流通 信息 ,其 
中 图 书信 息 包 括 题名 、 条 码 、 借 还 时 间 , 读 者 信息 包括 
一 卡通 号 、 入 学 时 间 、 所 在 院 系 和 专业 。 


3 研究 思路 与 过 程 


3.1 读者 身份 特征 提取 

根据 读者 的 社会 角色 来 划分 ,确定 研究 样本 后 ,对 
读者 进行 差异 化 分 组 ,分 组 的 原则 要 反映 出 知识 偏好 
的 差异 ,如果 不 能 分 离 出 组 别 之 间 的 知识 偏好 , 则 分 组 
写 无 意义 。 我 国 高 校本 科 生 读者 的 基本 社会 身份 是 学 
生 吴 份 , 绝 大 多 数 都 是 年 龄 达到 18 周岁 ,经 历 基 础 教 
育 、 高 中 教育 后 ,通过 高 等 教育 入 学 考试 ,进入 高 校 接 


映 不 同 专 业 方 向 读者 和 图 书 分 类 之 间 的 阅读 偏好 , 连 
线 的 宽度 反映 了 不 同 专业 读者 和 不 同 图 书 分 类 之 间 的 
借阅 数量 。 图 1 表明 ,从 专业 方向 角度 看 ,每 个 专业 方 
向 的 读者 都 有 明显 的 借阅 偏好 ,如 借阅 量 最 大 的 机 械 
设计 制造 及 其 自动 化 专业 ,T 类 图 书 的 借阅 量 接 近 该 
类 读者 借阅 总 量 的 半数 ;从 图 书 分 类 角度 看 ,T 类 图 书 
的 借阅 对 象 主要 来 自理 工科 专业 方向 的 读者 。 其 他 专 
业 方向 的 读者 也 大 都 具有 类 似 的 借阅 特征 。 因 此 , 读 
者 的 专业 方向 与 图 书 分 类 流通 之 间 具 有 茶 种 必然 的 联 
系 。 然 而 由 于 读者 的 专业 方向 并 不 能 直接 与 图 书 分 类 
之 间 建 立 起 必然 的 联系 ,还 需要 深入 读者 专业 方向 学 
习 内 容 层 面 ,寻找 更 加 可 靠 的 证 据 和 关联 关系 。 
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图 1 2014 年 入 学 读者 图 书 分 类 借阅 分 布 


3.3 ”专业 课程 与 流通 分 布 趋势 分 析 

课程 是 专业 的 具体 表达 和 体现 ,高 校 读者 主要 通 
过 海 业 课程 完成 专业 学 习 , 考 察 专业 方向 与 图 书 分 类 
借阅 之 间 的 关系 ,可 利用 专业 方向 作为 关键 读者 特征 
手 聊 ,每 个 专业 方向 都 是 由 多 门 课程 组 成 ,相关 专业 方 
向 砚 课 程 设置 重复 率 高 。 在 分 析 读者 专业 方向 与 图 书 
流通 之 间 关系 时 ,深入 到 专业 课程 层面 ,考察 图 书 流通 
与 蜡 程 的 关系 ,能 够 更 加 准确 发 现 图 书 流 通 与 专业 方 
际 之 间 的 关系 。 本 研究 依据 该 校 57 个 专业 的 《本 科 专 
JIER 才 培养 方案 》 ,包括 通 识 必修 课程 .学 科 基 础 课程 、 
礁 池 必修 课程 ,将 每 个 专业 课程 用 课程 使 用 教材 的 图 
书 芬 类 方式 进行 归 类 ,最 后 ,在 图 书 22 类 层面 ,汇总 每 
-2 王 书 分 类 中 包含 的 课程 数量 ,得 到 22 类 总 计 1 191 
门 课程 ,按照 图 书 每 一 分 类 的 课程 数量 除 以 课程 总 量 
1I 团 门 ,得 到 课程 分 类 比 。 图 书 流通 比 的 计算 方法 ， 
是 网 22 类 图 书 分 类 层面 ,计算 每 一 大 类 的 图 书 流通 数 
量 和 该 图 书馆 全 部 的 流通 量 之 比 ,得 到 流通 比 。 通 过 
图 书馆 流通 比 和 课程 分 类 比 的 对 比 ( 见 图 2) 可 以 看 
出 ,除了 A 类 .GC 类 和 1 类 图 书 以 外 ,课程 分 类 比 曲 线 


3.4 ”专业 课程 与 图 书 分 类 相关 性 分 析 

专业 方向 是 由 多 门 课 程 集合 体现 ,但 课程 集合 的 
组 合 ,在 图 书 分 类 上 的 映射 未 必 唯 一 ,甚至 还 可 能 较为 
分 散 ,因此 ,关于 读者 的 课程 与 图 书 的 相关 性 ,还 需要 
做 进一步 分 析 验 证 ,才能 确保 基于 课程 的 专业 方向 作 
为 研究 变量 具有 采用 信和 度 。 采 用 数据 可 视 化 方法 一 一 
热 图 分 析 课 程 设置 与 图 书 分 类 相关 性 关系 见 图 3 ,其 
中 横 坐 标 代表 图 书 分 类 , 纵 坐标 代表 专业 方向 ,中 间 交 
又 部 分 颜色 热度 代表 每 个 专业 课程 分 类 在 各 个 图 书 分 
类 中 的 数量 大 小 。 通 过 直接 观察 发 现 ,各 个 专业 的 课 
程 数 量 的 分 布 ,具有 明显 的 差异 性 。 按 照 各 个 专业 的 
课程 分 类 包括 通 识 教育 课程 和 核心 专业 课程 ,以 近年 
来 连续 招生 的 37 个 专业 为 例 , 专 业 课程 分 类 明显 具 
有 4 个 层次 :第 一 层次 为 了 类 课程 ,专业 课程 数量 最 
多 ,课程 在 各 专业 之 间 的 分 布 也 更 加 分 散 和 均匀 , 呈 
现 明显 的 工科 专业 教育 特征 ,其 中 专业 聚 类 也 表明 ， 
以 机 械 设计 制造 及 其 自动 化 专业 和 材料 成 型 及 控 秆 
工程 两 个 专业 的 特征 最 为 明显 。 第 二 层次 为 FG、0 
类 课程 ,在 数量 上 处 于 第 二 层次 ,在 课程 分 布 上 ,0 类 
与 了 类 具有 相似 的 分 布 特征 ,呈现 分 布 均匀 的 状态 ， 
根据 热 图 显著 性 和 聚 类 结果 ,表明 工程 力学 和 材料 
物理 专业 ,在 0 类 课程 的 数量 上 更 为 明显 ,F、C 类 在 
分 布 上 则 集中 在 少数 几 个 专业 上 。 第 三 层次 范围 较 
大 ,包括 A.C.D.H、J.K、Q.U、X 等 9 类 。A 类 和 
类 的 分 布 较为 均匀 ,表明 公共 通 识 课 的 教材 分 类 , 主 


LS 


与 流通 比 曲线 变化 趋势 大 体 一 致 ,说 明 专业 和 图 书 分 
类 之 间 呈 关联 关系 。 
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上 痢 放 站 区 王 过 过 工本 下 本 人 下 
图 书 分 类 
- - -课程 


流通 


2 课程 比 与 流通 比 对 比 


要 集中 在 A 类 和 类 ;其 他 7 类 图 书 在 分 布 上 较为 
集中 ,表明 每 一 类 都 有 能 映射 到 相关 专业 。 第 四 类 
包括 课程 数量 较 少 或 没有 属于 该 类 的 课程 。 如 图 3 
中 的 BNP\R 这 4 类 课程 较 少 ,I.S、V、Z 这 4 类 没 
有 出 现 课 程 。 
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3 人 GN 专业 方向 与 分 类 图 书 流通 量 相关 性 分 析 
_ 伍 专业 方向 读者 的 借阅 情况 ,如 果 能 够 与 专业 课程 在 
鸭 和 分 类 上 的 热点 特征 吻合 ,就 可 以 确认 无 误 地 把 读者 
专 园 方向 作为 建 模 分 析 的 关键 指标 。 通 过 统计 各 个 专 
业 这 向 读者 在 各 个 分 类 的 借阅 数量 ,绘制 专业 图 书 的 大 
人 
图 书 的 借阅 量 情况 与 图 3 专业 课程 的 借阅 情况 具有 较 
好 的 吻合 ,专业 方向 读者 的 借阅 偏好 更 加 集中 ,其 中 了 
类 类 .0 类 T 类 与 图 3 的 专业 课程 分 布 特征 几乎 一 
致 ,说 明 本 研究 基点 , 即 把 读者 的 专业 方向 作为 影响 图 
书 流通 主要 因素 的 假设 成 立 。 同 时 ,图 书 流通 量 较 大 的 
类 别 中 ,1 类 并 没有 任何 课程 与 专业 映射 ,需要 关注 。 
3.6 ”读者 数量 与 图 书 流通 量 的 相关 性 分 析 

对 读者 数量 和 流通 量 进行 Pearson 相关 系数 检验 ， 
设 定 置信 区 间 95% ,由 表 1 可 见 ,除了 D、G 类 图 书 以 
外 , 绝 大 多 数 社会 科学 类 图 书 流通 量 与 读者 的 数量 具有 
明显 的 相关 性 ,而 自然 科学 类 图 书 与 读者 数量 没有 相关 
关系 ,这 与 人 们 日 常 经 验 不 相符 。 因 此 ,读者 数量 单一 
因素 并 不 完全 是 影响 图 书 流通 率 的 关键 因素 ,还 需要 将 
读者 数量 因素 放 在 不 同 的 分 类 组 合 下 ,经 过 综合 分 析 
后 ,才能 确定 读者 数量 对 图 书 流通 量 的 影响 作用 。 
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图 3 专业 课程 与 图 书 分 类 相关 性 热 图 


表 1 读者 数量 与 图 书 流通 量 Pearson 相关 系数 检验 


妈 书 分 类 A B C D E F G H I | K 


p 值 0.02 0.00 0.00 0.61 0.00 0.00 0.15 0.00 0.00 0.04 0.00 
cor 0.22 0.55 0.36 0.05 0.62 0.25 0.13 0.36 0.65 0.18 0.59 


书 分 类 N 0 P QQ R Ss TT U y x 2Zz 


p 值 0.00 0.00 0.00 0.02 0.00 0.09 0.00 0.20 0.02 0.65 0.00 
cor 0.45 0.63 0.46 0.30 0.47 0.46 0.72 0.15 0.40 -0.07 0.57 


3.7 ”入 学 批 次 与 图 书 相关 性 分 析 

入 学 批 次 是 分 类 变量 ,采用 单 因素 方差 分 析 方 法 
检验 后 ,得 到 入 学 批 次 对 图 书 流通 量 的 影响 。 检 验 结 
果 表 明 , 入 学 批 次 仅仅 对 社会 科学 中 B.C、F、K 4 类 图 
书 流通 量 有 影响 。 可 见 单一 的 专业 入 学 批 次 因素 ,对 
分 类 图 书 流通 量 的 影响 特征 不 明显 ,但 专业 入 学 批 次 
因素 与 其 他 读者 特征 组 合 , 对 图 书 借阅 量 的 影响 作用 ， 
需要 在 线性 回归 方法 中 进一步 观察 。 
4 建 模 与 实验 过 程 
4.1 模型 选择 

本 研究 采用 最 小 二 乘法 进行 多 元 线性 回归 ,基于 
公式 (2) ,按照 图 书 基本 分 类 的 22 类 ,分 别 将 每 一 类 的 
流通 量 作 为 因 变量 ,将 其 他 数据 作为 自 变量 输入 模型 ， 
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95% 的 置信 区 间 , 采 用 逐步 法 ,分 别 按照 22 类 的 


量 作为 因 变 量 (y ) .读者 专业 (x,) .各 专业 读者 数 
,) .读者 入 学 批 次 (x,) ,导入 数据 ,并 对 模型 优 
型 假设 性 进行 检验 。 
"三 计算 后 发 现 ,除了 S 类 的 数据 样本 量 过 小 , 残 差 自 
由 | 国 为 零 ,不 能 建立 模型 ,其 他 21 类 都 可 通过 模型 得 
到 拟 合 ,然而 所 有 的 残 差 都 旦 指数 趋势 特征 ,不 符合 原 
始 假设 ,模型 没 能 通过 检验 。 为 了 保证 在 分 析 过 程 中 
继续 采用 线性 回归 方法 ,对 图 书 流通 量 进 行 对 数 变换 ， 
变量 变换 后 ,从 Q-Q 图 ( 见 图 5) 观 察 可 以 初步 确定 , 变 
量 符合 线性 假设 , 残 差 符合 正 态 性 要 求 ,除了 S 类 图 
书 ,其 他 21 类 图 书 的 流通 量 拟 合 模型 , 均 通过 检验 。 
4.2， 拟 合 验证 

确立 模型 后 ,对 模型 优 度 模型 假设 性 进行 检验 ， 
结果 见 表 2。 

自然 科学 部 分 :总 体 来 看 ,所 有 分 类 的 下 分 布 的 p 
值 均 小 于 0.05 ,模型 有 效 性 通过 检验 ,其 中 ,0OT.U X 


h 人 


类 的 模型 R 平方 都 超过 80% ,说 明 模 型 解释 外 


强 O N 


.P.Q.R 这 


4 类 图 书 ,从 拟 合 


6 力 较 
效果 看 ,模型 解释 


能 力 偏 低 。 
从 模型 的 正 态 性 \、 同 方差 检验 来 看 ,只 有 U 类 和 7Z 


机 械 设计 制造 及 其 自动 化 
材料 成 型 及 控制 工程 
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EE 


法 学 30 
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国际 经 济 与 贸易 

全 介 避 系 视 
工程 

移 流 工程 

电子 商务 


图 4 专业 方向 与 分 类 图 书 流通 热 图 


类 完全 通过 检验 ,其 他 分 类 没有 通过 检验 ,说 明 模型 的 


准确 率 受 到 其 他 因素 的 影响 ,尤其 是 在 不 能 引入 其 他 


读者 特征 作为 新 的 变 


寻找 突破 口 。 


量 情况 下 ,需要 在 因 变 量 的 方面 


从 变量 的 系数 来 看 ,影响 NPQ.\R 这 4 类 图 书 流 
通 量 ,只 有 读者 数量 单一 特征 因素 ;影响 0、T.U、X 类 
图 书 流通 量 的 因素 ,是 专业 方向 和 入 学 批 次 两 个 因素 ; 


影响 V\Z 类 图 书 流通 


量 的 因素 ,是 读者 数量 和 专业 方 


向 两 个 因素 发 挥 作用 。 

社会 科学 部 分 :模型 的 拟 合 值 R 方 ,都 在 50% 以 
上 ( 见 表 3), 拟 合 效果 较 好 ,模型 的 了 统计 量 p 值 都 远 
远 小 于 0. 05 ,模型 有 效 性 通过 检验 。D-W 检验 结果 表 
明 ,模型 有 较 好 的 残 差 独立 性 , 正 态 性 检验 结果 全 部 大 
于 0. 05 意味 着 残 差 和 样本 都 符合 正 态 分 布 ,同方 差 检 
验 仅 有 下 类 模型 通过 检验 ,说 明 其 它 分 类 尚 存在 其 他 
影响 因素 ,与 自然 科学 部 分 情况 相似 ,也 需要 在 因 变 量 
的 方面 寻找 突破 口 。 


4.3 ”分 析 与 实验 一 一 细 分 因 变 量 


由 于 在 图 书 的 基本 分 类 层面 


i, 绝 大 多 数 模型 的 正 


态 性 和 同方 差 不 能 


通过 检验 ,意味 着 样本 分 布 的 噪声 


影响 较 大 ,在 无 法 增加 实验 样本 和 自 变 量 的 情况 下 ,对 
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we 》 -2 -1 这 i | fk. 
CD ~ | a 
© Theoretical Quantiles Ve 
© Im(log(count)~tmp_gradetnumber) 3 了 
图 
< 二 图 5 模型 Q-Q 图 
CO 表 2， 自然 科学 部 分 分 类 模型 指标 汇总 
Ca 忆 分 类 N 0 P Q R T U V X Z 
EN R2 0. 129 0.844 0.222 0. 096 0.145 0. 855 0.83 0.318 0.967 0.539 
人 验 p 值 0. 009 0 0 0.018 0 0 0 0.016 0 0.002 
nm 
同方 差 检验 0. 607 0.007 0.807 0.825 0.927 0.004 0.077 0.047 0.673 0.199 
大 王 儿 六 性 检验 2. 129 2.311 1.757 1.811 1.898 2.524 2.75 1.852 2.724 2. 624 
Sr 0 0.101 0 0 0.001 0.013 0.18 0.101 0. 006 0.795 
os 量 1 1 1 1 1 1 
入 学 批 次 1 1 1 1 1 1 
专业 1 1 1 1 
ncvTest( ) 0.766 0.131 0.787 0.841 0.945 0 0.68 0.001 0.104 0.888 
表 3 社会 科学 部 分 分 类 模型 指标 汇总 
图 书 分 类 A B C D E F G H I J K 
R2 0. 14 0.6 0. 69 0. 65 0.7 0.64 0.59 .13 0.77 0.56 0.622 
模型 检验 p 值 0 0 0 0 0 0 0 0 0 0 0 
同方 差 检验 0.11 0.01 0.08 0.24 0.22 0.01 0.18 0 0 0.05 0.023 
残 差 独立 性 检验 2 2.37 2.15 2.44 2.45 2.28 2.44 2.42 2.48 2.5 2.569 
方差 正 态 0.65 0.65 0.61 0.1 0.65 0. 26 0. 46 人 0. 85 0.72 0.293 
学 生 数 量 1 1 
入 学 批 次 1 1 1 1 1 1 1 1 
专 | 1 1 1 1 1 1 1 1 1 1 
ncvTest( ) 0.98 0 0.36 0.18 0.99 0 0.07 0 0 0 0.031 
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因 变 量 分 析 还 可 以 考虑 一 种 情况 , 即 图 书 分 类 的 层次 


较 多 ,每 一 分 类 下 


属 子 分 类 又 会 对 分 类 进行 细 化 ,读者 


偏好 的 图 


,可 能 在 下 一 级 类 目 中 ,被 其 他 子 类 目 干 


扰 。 因 此 ,需要 更 加 细致 地 对 图 了 


分 类 类 目 进 行 分 析 。 


在 二 级 分 类 中 ,对 于 模型 不 能 通过 检验 的 BF、H、 
IJK.OT 等 8 类 子 类 进行 筛选 ,找到 关键 影响 的 子 
类 ,总 体 来 看 ,从 模型 的 R 来 看 ,对 变异 的 解释 能 力 均 
超过 50% ,最 高 的 TG 类 已 经 达到 92.8% 。 


自然 科学 部 分 :进入 到 二 级 类 目 后 ( 见 表 4) ,模型 
的 所 有 检验 均 得 以 通过 ,模型 拟 合 度 明显 提高 ,从 一 级 
分 类 中 的 0、T 类 结果 来 看 ,读者 的 专业 特征 与 图 书 的 
流通 具有 良好 的 匹配 ,读者 的 专业 特征 也 得 到 良好 的 
反映 ,值得 注意 的 是 ,入 学 批 次 在 绝 大 多 数 分 类 图 书 流 
通 中 被 保留 下 来 ,这 也 说 明 读 者 之 间 社 会 化 信息 与 知 
识 互动 对 图 书 流通 具有 重要 影响 。 


表 4 自然 科学 部 分 二 级 分 类 图 书 模型 指标 


分 类 R2 F 统计 量 p 值 Bptest( ) 检 验 DW 检验 正 态 性 检验 人 数 批 次 专业 nevTest( ) 检验 
02 0.747 0 0. 133 2.344 0.977 1 1 1 0. 289 
03 0. 807 0 0. 112 2.333 0. 132 1 1 0. 675 
TB 0. 863 0 0.051 2.216 0.259 1 1 0.917 
Tc 0. 928 0 0. 151 2.542 0.31 1 1 0. 808 

> 

GO 0. 882 0 0. 064 2.682 0.319 1 1 0.384 
LOm 0. 826 0 0. 108 2.552 0.052 1 1 0.079 
Ca 0. 894 0 0. 143 2.599 0. 168 1 1 0.61 
Sn 0.766 0.015 0. 136 3.019 0. 266 1 1 0.02 
< TU 0. 699 0 0. 107 2:51 0.743 1 0.507 


© 

CD 社会 科学 部 分 :社会 科学 在 二 级 分 类 中 ( 见 表 5) 有 
和 类 共 9 个 二 级 子 分 类 通过 了 模型 检验 ,其 中 了 类 的 
JE 对 应 的 是 艺术 专业 ,影响 因素 是 专业 特征 和 入 学 


批 次 特征 。F 类 对 应 的 是 经 济 专业 ,也 通过 F8 表现 了 专 


业 影 响 力 。 总 体 来 看 ,社会 科学 部 分 对 图 书 流通 起 到 关 
键 作用 的 入 学 批 次 ,读者 人 数 的 影响 与 专业 的 影响 出 现 
3 次 ,说 明 相似 年 龄 特征 的 读者 ,社会 科学 知识 的 需求 具 
有 普遍 性 ,关注 热点 分 别 为 B5、B 、K2 、K9 类 。 


(Gx R2 ”统计 量 p 值 ”Bptest 检验 DW 检验 正 态 性 检验 人 数 批 次 专业 ncvTest 检验 
全 
mm BS 0.617 0 0.211 2.266 0.611 h 1 0.948 
et 0.641 0 0.164 2.68 0.218 1 at 
B 0.655 0 0.059 2.464 0.234 L 1 0.869 
J 二 人 0 0. 165 2.692 0.079 L 1 0.205 
及 0.699 0.014 0.387 2.998 0.075 1 1 0.67 
K2 0.558 0 0.049 2.829 迁 区 并 1 0.302 
K9 0.675 0 0.064 2 12 和 对 1 1 0.927 


对 于 未 能 通过 检验 的 二 级 分 类 模型 ,依然 需要 进 
入 三 级 分 类 .四 级 分 类 进行 建 模 分 析 , 直 至 最 后 对 图 书 
馆 全 部 流通 数据 进行 建 模 分 析 ( 见 表 6) 。 在 三 级 四 级 
图 书 类 目 中 ,有 6 大 类 7 个 三 级 子 类 目 .6 个 四 级 子 类 
目 通过 模型 检验 。 其 中 ,A85 类 对 应 的 是 读者 课程 ， 
H31 与 公共 课程 英语 对 应 ,F、0、TP2 三 大 类 的 子 类 目 
与 专业 对 应 。I 类 文学 部 分 对 应 的 是 中 国 各 时 期 文学 
的 作品 集 。 从 相关 系数 来 看 ,图 书 流通 的 关键 影响 因 
素 依 旧 是 专业 方向 和 入 学 批 次 。 

总 体 来 看 ,读者 专业 特征 能 够 在 较 大 的 图 书 分 类 


范围 内 对 图 书 流通 量 进行 解释 ,读者 入 学 批 次 和 读者 
数量 ,需要 与 读者 的 专业 特征 结合 ,才能 具有 更 加 有 意 
义 的 解释 价值 。 
4.4 拟 合 和 预测 

利用 模型 对 原样 本 数据 ,以 随机 选取 的 5 个 不 同 层级 
图 书 分 类 为 例 ,对 2014 年 不 同 专业 读者 流通 情况 进行 模 
型 拟 合 ( 见 图 6) ,通过 图 书 流通 拟 合 结果 和 原 值 比较 , 模 
型 拟 合 值 与 实 值 基本 相等 ,并 且 模 型 的 拟 合 结果 略 显 保 
守 。 这 说 明 选 择 的 变量 与 图 书 流通 数量 之 间 具 有 较 强 的 
因果 关系 ,能 够 描述 和 解释 读者 图 书 借阅 的 需求 趋势 。 
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表 6 部 分 三 级 分 类 的 模型 检验 指标 
分 类 R2 模型 检验 p 值 ”同方 差 检验 DW 检验 方差 正 态 人 数 批 次 专业 nevTest 
A85 0.978 0.027 0.227 3.014 0.013 1 1 1 0.915 
F22 0.739 0.033 0.222 2.441 0.004 1 1 1 0.314 
F71 0.598 0 0. 194 2.563 0.115 1 1 0.106 
H310 0.6 0 0.169 2.504 0.332 1 1 0.811 
H311 0. 966 0.003 0. 183 2.413 0.504 1 1 0.571 
H314 0.58 0.001 0. 065 2.713 0.226 1 1 0.618 
H315 0. 645 0 0.002 2.292 0.626 1 1 0.989 
D10 0. 849 0 0.052 2.647 0.505 1 1 0.697 
D17 0. 653 0 0.221 2.445 0.342 1 1 0.09 
041 0. 826 0 0. 122 2.738 0.052 1 1 0.313 
043 0.9827 0.009 281 2.749 0.361 1 1 1 0.127 
TP2 0.718 0 0.06 2.289 0.321 1 1 0.178 
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模型 对 未 来 图 书 流通 趋势 预测 是 建立 模型 的 关键 
步骤 ,模型 预测 的 结果 是 对 某 一 批 次 读者 总 体 流通 趋 


模型 具有 较 好 的 拟 合 预测 效果 ,能 够 对 图 书 流通 进行 
有 效 描述 和 准确 预测 。 随 着 未 来 读者 流通 数据 量 以 及 


势 的 预测 ,反映 到 当前 年 度 的 流通 趋势 , 则 要 在 总 需求 
预测 中 减 去 不 同人 学 批 次 读者 以 及 发 生 的 流通 结 
Pa= Pi- Ci 公式 (5 ) 
公式 (5) 中 ,P 为 预测 值 ,C 为 已 经 发 生 的 流通 数 
,i 为 图 书 分 类 ,j 为 人 学 批 次 , k 为 预测 年 级 ,Pi 为 ji 
类 图 书 读者 未 来 总 流通 量 预测 值 ,P; 为 批 次 读者 对 i 
类 图 书 的 总 流通 预测 值 ,Ci 为 j 入 学 批 次 读者 i 类 图 书 
已 经 发 生 的 流通 量 。 
根据 公式 (5 ) 对 当前 在 校 读 者 (2015 年 -2018 年 
入 学 的 学 生 ) ,可 能 发 生 的 图 书 流通 情况 进行 分 类 预 
测 ,结果 见 表 7。 
从 提取 出 的 20 个 图 书 分 类 的 流通 量 预测 结果 来 
看 ,对 于 2015 年 -2018 年 人 学 的 学 生 读者 借阅 趋势 ， 


三 
里 


可 观测 数据 类 型 的 增加 ,预测 结果 的 精度 将 会 进一步 


5 研究 结论 


本 研究 对 不 同类 别 图 书 的 流通 量 因 素 进行 分 析 ， 
通过 相关 分 析 、 聚 类 分 析 , 针 对 读者 集合 R, 提 取 了 专 
业 方向 .专业 方向 的 读者 数量 ,读者 人 学 时 间 3 个 有 代 
表 性 的 读者 特征 因素 ,作为 随机 变量 ,运用 线性 回归 方 
法 ,对 图 书 流通 进行 建 模 ,取得 较 好 的 拟 合 和 预测 效 
果 。 实 验 结果 表明 : 

(1) 图 书馆 流通 可 建立 数学 模型 进行 描述 。 看 似 
杂乱 的 读者 随机 借阅 行为 ,具有 深刻 的 数理 统计 规律 
通过 机 器 学 习 的 线性 回归 方法 ,建立 数学 拟 合 模型 ,能 


O 
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校 图 书馆 读者 借阅 趋势 线性 回归 建 模 预 测 探析 [J]. 图 书 情报 工作 ,2020,64(3) :59 -70. 


表 7 模型 预测 结果 单位 :次 
预测 指标 流 预 测 值 (P;) 批 次 读者 实际 流通 量 ( C;) 未 来 总 流通 量 预测 值 (Pij) 
批 次 读者 2015 2016 2017 2018 2015 2016 2017 2018 2015 2016 2017 2018 
A 165 164 163 160 107 77 3 0 58 87 160 160 
B 821 829 831 863 447 140 28 0 374 689 803 863 
C 302 309 324 404 133 44 0 0 169 265 324 404 
D 500 502 503 513 184 18 9 0 316 484 494 513 
E 143 143 142 141 46 27 2 0 97 116 140 141 
F 947 955 960 982 280 63 9 0 667 892 951 982 
G 239 240 242 252 88 32 15 0 151 208 227 252 
H 1 839 1 836 1 833 1 823 1 054 296 75 0 785 1 540 1 758 1 823 
I 5 370 5 417 5 457 5 617 3 974 1 662 343 0 1 396 3 755 5 114 5 617 
J 381 381 382 382 155 116 31 0 226 265 351 382 
K 846 884 901 1012 456 178 59 0 390 706 842 1 012 
N 62 62 61 57 20 2 1 0 42 60 60 57 
0 2 368 2 427 2 415 2 623 1 574 446 131 0 794 1981 2 284 2 623 
P 90 90 91 92 35 3 1 0 55 87 90 92 
Q 89 89 91 94 27 10 4 0 62 79 87 94 
人 R 112 112 112 113 21 6 4 0 91 106 108 113 
A S 73 72 72 71 2 0 0 0 71 72 疯 71 
| 
LS T 6 680 6 766 6 799 7 006 3 118 562 93 0 3 562 6 204 6 706 7 006 
CD U 280 281 280 295 104 37 18 0 176 244 262 295 
© V 34 34 34 34 7 7 1 0 27 27 33 34 
© X 97 96 99 98 3 0 1 0 94 96 98 98 
2 105 114 123 160 74 6 3 0 31 108 120 160 
NN 
够 搬 述 分 类 相同 读者 的 图 书 借阅 行为 规律 ,准确 预测 | 个 体 ,汲取 社会 知识 的 内 在 动力 因素 更 加 复杂 ,仅仅 依 


图 流通 量 ,也 能 够 合理 解释 读者 借阅 行为 的 内 在 动 
证 因 未 和 外 在 的 社会 交流 因素 。 
(2) 知识 需求 是 读者 分 类 的 关键 。 读 者 的 知识 行 
为 开动 ,虽然 与 读者 自身 的 修养 .工作 和 生活 息 息 相 
冷 特 读者 社会 关系 角色 的 工作 生活 内 容 密切 相连 。 
但 吹 研究 的 结果 来 看 ,代表 读者 知识 需求 的 重要 特 
征 二 一 读 者 的 专业 学 习 方向 ,与 特定 的 图 书 分 类 具有 
直播 关联 关系 ,并 在 模型 中 起 到 关键 作用 ;而 专业 读者 
的 数量 和 读者 入 学 批 次 等 知识 需求 特征 不 明显 的 因 
素 ,对 图 书 流通 的 影响 作用 并 不 明显 。 对 于 没有 观测 
到 的 读者 特征 ,如 读者 年 龄 阶段 下 有 关 社 会 .情感 . 婚 
姻 等 知识 需求 的 特征 ,分 别 在 相关 分 类 图 书 和 模型 残 
差 中 得 以 体现 。 

(3 ) 自然 科学 类 图 书 读者 易于 划分 识别 边界 。 从 
图 书 分 类 角度 来 看 , 自然 科学 与 理工 类 流通 图 书 的 读 
者 行为 与 特征 相对 易于 描述 分 析 , 说 明理 工 类 知识 的 
专业 性 较 强 , 非 专业 读者 涉猎 较 少 。 利 用 读者 的 专业 
特征 ,就 能 很 好 地 对 读者 进行 分 类 ,分 类 后 的 读者 群体 
专业 特征 相近 ,图 书 借阅 的 特征 指向 较为 清晰 ,模型 拟 
合 效果 较 好 。 

(4) 社 会 科学 类 读者 区 分 边界 模糊 。 社 会 科学 方 
面 的 图 书 流通 ,专业 类 的 读者 和 非 专 业 类 读者 混杂 度 较 
高 ,模型 的 拟 合 度 往往 不 高 。 这 说 明 读者 作为 社会 化 的 


徘 读 者 专业 方向 尚 不 能 较 好 对 读者 分 类 进行 分 隔 , 还 需 
要 挖 气 更 多 的 读者 细 分 特征 ,进行 更 加 深 入 的 研究 , 才 
能 提高 模型 拟 合 预测 的 精度 ,发 现 更 加 隐秘 的 规律 


6 结语 


本 研究 运用 线性 回归 分 析 方 法 ,以 易于 获取 的 读 
者 特征 对 读者 进行 分 类 ,以 高 校本 科 生 读 者 专业 方向 、 
专业 方向 读者 数量 和 读者 入 学 批 次 3 个 量化 指标 作为 
建 模 分 析 的 关键 变量 ,描述 读者 需求 并 预测 图 书馆 流 
通 趋势 。 不 仅 为 揭示 读者 借阅 行为 提供 了 方法 与 借 
鉴 , 同 时 也 为 采用 读者 分 类 特征 进行 知识 获取 行为 分 
析 ,提供 了 探索 方向 和 研究 思路 。 通 过 分 析 读 者 借阅 
的 内 在 心理 动机 ,为 进一步 挖掘 读者 产生 知识 需求 的 
促 动因 素 ,探讨 图 书 借阅 行为 发 生 的 动机 强度 等 提供 
了 一 个 可 能 的 突破 口 。 由 于 获取 数据 单一 ,为 使 读者 
分 类 特征 稳定 ,本 文 仅 选 择 了 一 个 学 校 的 图 书馆 读者 
群体 作为 样本 ,在 后 续 研 究 中 ,将 不 断 获 取 新 的 数据 对 
模型 进行 验证 ,以 期 使 研究 扩展 到 更 多 类 型 的 高 校 图 
书馆 、 公 共 图 书馆 ,使 研究 结论 具有 更 广泛 实用 意义 。 
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© Abstract: [Purpose/significance| By means of the classification and cireulation data of library collection, the paper 
finds the close correlation between reader characteristics and library collection circulation, establish the relationship model. 
And through model fitting and prediction, this study explores the implicit rule between reader and library circulation which 
provides technical and means support for the intelligent management of library. | Method/ process | Firstly, this paper 
used clustering and correlation analysis techniques to extract the macroscopic observable characteristics of readers , con- 
structed the direct and indirect mapping relationship between reader characteristics and book classification, and then con- 
structed the regression model of the circulation of reader characteristics and classified books, and verified the validity of the 
model and optimized the goodness of fit of the model. According to the effective model, this paper explored the trend 
change of library circulation, and sum up the underlying rules of knowledge construction of the macroscopic characteristics 
of readers, as well as the impact on the circulation of books. | Result/conclusion | There are 3 classification characteris- 
tics of readers, namely, the professional learning direction representing the social role requirements of readers, the enroll- 
ment batch representing the interaction effect between readers and the number of readers, which can effectively fit and pre- 
dict the book circulation. The prediction results show that the model has high accuracy and can be used as an effective tool 
to provide reliable technical support for library to develop knowledge service. 
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